Comparación y combinación de los sistemas de traducción automática basados en n-gramas y en sintaxis

نویسندگان

  • Maxim Khalilov
  • José A. R. Fonollosa
چکیده

In this paper we shall compare two approaches to machine translation: the Syntax Augmented Machine Translation system (SAMT), which is a syntaxdriven translation system, underlain by phrase-based model, and the n-gram-based Statistical Machine Translation (SMT), in which a translation process is based on statistical modeling of the bilingual context. We provide a step-by-step comparison of the systems, reporting results in terms of automatic evaluation metrics and required computational resources for a smaller Arabic-to-English translation task from the news domain. Finally, we combine the output of both systems that yield to significant improvement of translation quality.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Construcción de los WordNets 3.0 para castellano y catalán mediante traducción automática de corpus anotados semánticamente

Este art́ıculo describe una metodoloǵıa de construcción de WordNets que se basa en la traducción automática de un corpus en inglés desambiguado por sentidos. El corpus que utilizamos está formado por las propias glosas de WN 3.0 etiquetadas semánticamente y por el corpus Semcor. Los resultados de precisión son comparables a los obtenidos mediante métodos basados en diccionarios bilingües para la...

متن کامل

Estudio Bidireccional de un Sistema de RI Multilingüe Basado en Traducción de n-Gramas

Resumen Continuando nuestra investigación sobre el empleo de ngramas de caracteres como unidad de traducción en sistemas de RI Multilingüe, este art́ıculo analiza el comportamiento de nuestra solución en direcciones inversas de traducción a partir de sendos experimentos paralelos con consultas en inglés sobre textos en español y viceversa. Lo positivo de los resultados corrobora la validez de nu...

متن کامل

Comprobación Automática de Requisitos de Calidad en Sistemas Multiorganizacionales

Resumen El uso de servicios WEB y de servidores de aplicaciones durante el desarrollo y explotación de sistemas multiorganizacionales basados en la WEB (MOWS), ha puesto de relieve algunas limitaciones de los actuales lenguajes de especificación de requisitos de calidad para soportar el tratamiento automático que, sobre este tipo de requisitos, precisan el desarrollo y la explotación de MOWS. E...

متن کامل

Variabilidad, Trazabilidad y Líneas de Productos: una Propuesta basada en UML y Clases Parciales

Uno de los problemas clave en el desarrollo de una línea de productos software es la representación y gestión de la parte común y variable de la misma. La forma habitual de definir ambos aspectos es mediante modelos de características o features que además permiten seleccionar la configuración de cada aplicación concreta dentro de la línea de productos. Sin embargo la trazabilidad entre los mod...

متن کامل

XTRA-Bi: Extracción automática de entidades bitextuales para software de traducción asistida

Resumen: El principal inconveniente de los sistemas de memorias de traducción es que para que lleguen a ser productivos requieren un costoso proceso previo de alimentación manual. XTRA-Bi desarrolla métodos de extracción y alimentación automática de segmentos bilingües a partir de corpora paralelos. La clave del método radica en la utilización del formato TMX para la importación de corpus previ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 41  شماره 

صفحات  -

تاریخ انتشار 2008